Most graph neural network models rely on a particular message passing paradigm, where the idea is to iteratively propagate node representations of a graph to each node in the direct neighborhood. While very prominent, this paradigm leads to information propagation bottlenecks, as information is repeatedly compressed at intermediary node representations, which causes loss of information, making it practically impossible to gather meaningful signals from distant nodes. To address this issue, we propose shortest path message passing neural networks, where the node representations of a graph are propagated to each node in the shortest path neighborhoods. In this setting, nodes can directly communicate between each other even if they are not neighbors, breaking the information bottleneck and hence leading to more adequately learned representations. Theoretically, our framework generalizes message passing neural networks, resulting in provably more expressive models, and we show that some recent state-of-the-art models are special instances of this framework. Empirically, we verify the capacity of a basic model of this framework on dedicated synthetic experiments, and on real-world graph classification and regression benchmarks, and obtain state-of-the-art results.
translated by 谷歌翻译
Federated Learning (FL) is a machine learning paradigm that enables the training of a shared global model across distributed clients while keeping the training data local. While most prior work on designing systems for FL has focused on using stateful always running components, recent work has shown that components in an FL system can greatly benefit from the usage of serverless computing and Function-as-a-Service technologies. To this end, distributed training of models with severless FL systems can be more resource-efficient and cheaper than conventional FL systems. However, serverless FL systems still suffer from the presence of stragglers, i.e., slow clients due to their resource and statistical heterogeneity. While several strategies have been proposed for mitigating stragglers in FL, most methodologies do not account for the particular characteristics of serverless environments, i.e., cold-starts, performance variations, and the ephemeral stateless nature of the function instances. Towards this, we propose FedLesScan, a novel clustering-based semi-asynchronous training strategy, specifically tailored for serverless FL. FedLesScan dynamically adapts to the behaviour of clients and minimizes the effect of stragglers on the overall system. We implement our strategy by extending an open-source serverless FL system called FedLess. Moreover, we comprehensively evaluate our strategy using the 2nd generation Google Cloud Functions with four datasets and varying percentages of stragglers. Results from our experiments show that compared to other approaches FedLesScan reduces training time and cost by an average of 8% and 20% respectively while utilizing clients better with an average increase in the effective update ratio of 17.75%.
translated by 谷歌翻译
一致性检查是一种过程挖掘技术,允许验证过程实例与给定模型的符合性。因此,该技术被预定在医学环境中用于将治疗案例与临床准则进行比较。但是,医学过程是高度可变,高度动态和复杂的。这使得难以在医疗领域中使用命令性一致性检查方法。研究表明,声明性方法可以更好地解决这些特征。但是,这些方法尚未获得实际接受。另一个挑战是对齐,通常不会从医学角度增加任何价值。因此,我们在案例研究中调查了HL7标准Arden语法对于宣言性,基于规则的符合度检查和使用手动建模的对齐方式的可用性。使用该方法,可以检查治疗案例的一致性,并为医疗指南的大部分地区创建有意义的对齐方式。
translated by 谷歌翻译
从废物电气和电子设备(WEEE)中有效拆卸和回收材料是将全球供应链从碳密集型,采矿材料转移到可回收和可再生的材料的关键步骤。常规的回收过程依赖于切碎和分类废物流,但是对于由许多不同材料组成的Weee,我们探索了针对许多物体的靶向拆卸,以改善材料恢复。许多WEEE对象都共享许多关键特征,因此看起来非常相似,但是它们的材料组成和内部组件布局可能会有所不同,因此,对于随后的拆卸步骤,为准确的材料分离和恢复而具有准确的分类器至关重要。这项工作介绍了RGB-X(一种多模式图像分类方法),该方法利用了来自外部RGB图像的关键特征,并从X射线图像中生成的图像来准确地对电子对象进行分类。更具体地说,这项工作开发了迭代类激活映射(ICAM),这是一种新型的网络体系结构,明确地侧重于用于准确的电子对象分类所需的多模式特征映射中的细节。为了培训分类器,由于费用和需要专家指导,电子对象缺乏大型且注释良好的X射线数据集。为了克服这个问题,我们提出了一种新的方法,可以使用应用于X射线域的域随机化创建合成数据集。合并的RGB-X方法使我们在10代现代智能手机上的准确度为98.6%,其单独的精度为89.1%(RGB)和97.9%(X射线)。我们提供实验结果3来证实我们的结果。
translated by 谷歌翻译
在本文中,我们通过使窗口长度成为可通过梯度下降来优化的连续参数,而不是经验调谐的整数值为值的超参数来重新审视频谱图的使用。此时,该贡献主要是理论上的,但是将修改后的STFT插入任何现有的神经网络都很简单。在本地箱中心固定并且独立于窗口长度参数的情况下,我们首先定义了STFT的可区分版本。然后,我们讨论窗口长度影响垃圾箱的位置和数量的更困难的情况。我们说明了该新工具在估计和分类问题上的好处,这表明它不仅对神经网络也可能引起任何基于STFT的信号处理算法感兴趣。
translated by 谷歌翻译
在我们的多元文化世界中,支持人类的情感意识AI系统需要能够感知各种文化情绪表达模式变化的影响的能力。这些模型必须在未经培训的文化背景下表现良好。情感计算中的一个标准假设是,在同一文化中受过训练和使用的识别模型(文化内部)的表现将比在一种文化中训练并用于不同文化(跨文化)的模型更好。我们测试了这一假设,并使用来自六种文化的现实世界二元相互作用的视频进行了对跨文化影响识别模型的首次系统研究。我们在时间因果发现下开发了一种基于注意力的特征选择方法,以识别可以在跨文化情感识别模型中利用的行为线索。在所有六种文化中,我们的发现表明,跨文化影响识别模型比内文化模型更有效或更有效。我们确定并为跨文化情感识别而做出有用的行为特征;在本研究的背景下,视觉方式的面部特征比音频方式更有用。我们的论文介绍了跨文化影响识别系统未来发展的概念和动机。
translated by 谷歌翻译
这项研究的重点是在分析二维肺X射线图像中的特定人工智能子场的应用,以辅助医学诊断普通肺炎。卷积神经网络算法是在基于Python编码的基于烧瓶的Web应用程序中实现的,该应用程序可以分析X射线图像以检测普通肺炎。由于卷积神经网络算法依靠机器学习来识别和检测模式,因此实施了一种称为转移学习的技术来训练神经网络,以识别和检测数据集中的模式。开源肺X射线图像被用作训练数据,以创建一个知识库,该知识库是Web应用程序的核心元素,实验设计采用了5次验证性测试来验证Web应用程序。 5次验证性测试的结果显示,每次试验的诊断精度百分比,一般诊断精度百分比和一般诊断错误百分比的计算,而混淆矩阵进一步显示了标签和Web应用程序相应诊断结果之间的关系。每个测试图像。开发的Web应用程序可以由医生可以在A.I.辅助诊断普通肺炎的诊断中以及计算机科学和生物信息学领域的研究人员中使用。
translated by 谷歌翻译
广播视频中的运动场注册通常被解释为同型估算的任务,该任务在平面场和图像的相应可见区域之间提供了映射。与以前的方法相反,我们将任务视为摄像机校准问题。首先,我们引入了一个可区分的目标函数,该功能能够根据已知校准对象的片段,即运动领域的片段,从段对应(例如,线,点云)中学习相机姿势和焦距。 。校准模块迭代地最小化了由估计的摄像机参数引起的段重新投影误差。其次,我们提出了一种从广播足球图像中进行3D运动场注册的新方法。校准模块不需要任何训练数据,并且与典型的解决方案进行了比较,该解决方案随后完善了初始估计,我们的解决方案在一个步骤中进行。评估了所提出的方法在两个数据集上进行运动现场注册,并与两种最先进的方法相比,取得了优越的结果。
translated by 谷歌翻译
自从17世纪以来,理论上就建立了非语言交流的\ Esquote*{Language}的手势。但是,它与视觉艺术的相关性仅偶尔表达。这可能主要是由于传统上必须手工处理的大量数据。但是,随着数字化的稳定进展,越来越多的历史文物被索引并提供给公众,从而需要自动检索具有类似身体星座或姿势的艺术历史图案。由于艺术领域因其风格差异而与现有的人类姿势估计的现实世界数据集有很大不同,因此提出了新的挑战。在本文中,我们提出了一种新颖的方法来估计艺术历史图像中的人类姿势。与以前试图用预训练模型或通过样式转移弥合域间隙的工作相反,我们建议对对象和关键点检测进行半监督学习。此外,我们引入了一个新颖的特定领域艺术数据集,其中包括人物的边界框和关键点注释。与使用预训练模型或样式转移的方法相比,我们的方法取得了明显更好的结果。
translated by 谷歌翻译
由于社交网络中的许多用户每天都在为网络欺凌活动暴露于网络欺凌活动,发现了冒犯性,仇恨和亵渎语言已成为一个关键挑战。在本文中,我们展示了分析不同文本特征,以检测Twitter上的仇恨或冒犯职位。我们提供了详细的实验评估,了解每个构建块在神经网络架构中的影响。在英语子任务1A上评估所提出的架构:从团队名称TIB-VA下识别来自Hasoc-2021数据集的帖子数据集的仇恨,冒犯和亵渎内容。我们比较了上下文词嵌入的不同变体,结合了字符级嵌入和收集的仇恨术语的编码。
translated by 谷歌翻译